spark dataframe 两列相减 | 您所在的位置:网站首页 › dataframe 两列相减生成新列 › spark dataframe 两列相减 |
Spark DataFrame 中两列相减可以通过 withColumn 方法结合 Spark SQL 函数来实现。具体来说,可以使用 subtract 函数来计算两列的差值,然后将结果存储在新列中。 以下是示例代码: from pyspark.sql.functions import col, subtract # 创建示例 DataFrame df = spark.createDataFrame([(1, 2), (3, 4), (5, 6)], ["col1", "col2"]) # 计算 col1 - col2,将结果存储在新列 col3 中 df = df.withColumn("col3", subtract(col("col1"), col("col2"))) # 打印结果 df.show()执行上述代码,会得到以下输出: +----+----+----+ |col1|col2|col3| +----+----+----+ | 1| 2| -1| | 3| 4| -1| | 5| 6| -1| +----+----+----+在这个示例中,我们创建了一个包含两列的 DataFrame。然后使用 withColumn 方法来计算两列的差值,并将结果存储在新列 col3 中。最后,我们打印结果以确认计算是否正确。 希望这个示例能够帮助你实现 Spark DataFrame 中的列相减操作。 |
CopyRight 2018-2019 实验室设备网 版权所有 |